其他
湖仓一体架构构建与平台应用实践(PPT)
数据仓库适合存储结构化的、信息密度高的、经过处理后的数据。例如我们通过大数据分析得到的关联信息、画像信息等,都可以放在数据仓库中。
“仓库”一词也将它的特点表现得清清楚楚。仓库,东西要放在规整的货架上,甚至还会给货架编号。这里的数据很规范,用起来没那么灵活。
数据湖适合存储非结构化的、信息密度低的、未经清洗的数据。例如生产中我们获取到的日志信息、长文本信息等都可以直接放到数据湖中。
曾经有一段时间,大家对于大数据的存储形式分裂为了两派。不断询问是选择数据湖,还是选择数据仓库?
选择数据湖,才能拥有数据的多样与灵活,有利于将不同的数据组合在一起,发现新的规律。选择数据仓库,才能拥有数据的规范与清晰,有利于数据的便捷使用,也利于数据的长时间存储。
湖仓一体,即打通数据仓库和数据湖两套体系,让数据和计算在湖和仓之间自由流动,从而构建一个完整的有机的大数据技术生态体系。这就像是在你的面前放了一个摆满了文档的书桌(数据湖),也放了一个小书架(数据仓库)。于是两者的数据以随意获取,在灵活与规范之间取得了平衡。
下面开始进入正文(添加文末歪老师微信好友可获取下方PPT)
<END>
1、政务数据治理与数据质量管理
2、数据管理平台建设方法论3、华为数字化转型:从战略到执行(PPT)4、企业IT数据架构规划方案(PPT)5、数据标签的分类、设计及实现方法6、9000字详解企业大数据项目规划落地实施路线图7
9、8000字详解银行业数据治理架构体系搭建10、网易数据治理大赛:数据管治建设实践11、企业数据资产盘点原则与方法12、
数据学堂